課程資訊
課程名稱
健康大數據分析
Analysis of Big Data in Health 
開課學期
112-1 
授課對象
公共衛生學院  公共衛生學系  
授課教師
馮嬿臻 
課號
PH0011 
課程識別碼
801 00090 
班次
 
學分
2.0 
全/半年
半年 
必/選修
選修 
上課時間
星期四3,4(10:20~12:10) 
上課地點
公衛214 
備註
公衛系生物統計與健康資訊領域專長必修。與江濬如、張慶國、王彥雯合授
限本系所學生(含輔系、雙修生)
總人數上限:30人 
 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程旨在提供對健康大數據分析的介紹。我們將對健康大數據的來源以及這些來源的優勢和局限性進行簡要的介紹,包含台灣與國際常見的健康資料庫;此外,在數據分析的部分,我們將從資料視覺化的方法開始講演,接著學習處理分群問題、分類問題、迴歸分析、與基因體資料的分析。 

課程目標
本課程的目的是介紹健康大數據分析的基本知識和技能。我們將使用免費的統計軟體R進行實際操作。學完本課程後,學生應該能夠使用R軟體分析健康大數據。 
課程要求
具備基礎生物統計學/統計學、迴歸分析的相關知識與R軟體基本的程式撰寫經驗。 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
 
參考書目
1. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. An Introduction to Statistical Learning with application in R. Springer Verlag, 2013.
2. Nina Zumel, John Mount. Practical data science with R, 2nd edition. Manning, 2019
3. Brett Lantz. Machine learning with R, 3rd edition. Packt, 2019.
4. Tan, Steinbach, Karpatne, Kumar. Introduction to data mining, 2nd edition. Pearson, 2020.
5. Watt, Borahni, Katsggelos. Machine learning redefined, 2nd edition. Cambridge University Press, 2020.
6. Hadley Wickham & Garrett Grolemund. R for data science. O’Reilly Media, Inc. 2017. (中文版由碁?出版)
7. Jared P Lander. R for everyone: advanced analytics and graphics, 2nd edition. Person education Ltd., 2017. (中文版由旗標出版) 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
出席狀況及課堂互動 Attendance, class participation and interaction 
10% 
 
2. 
作業Homework assignments 
50% 
 
3. 
課堂線上小考 In-class online quizzes 
20% 
 
4. 
期末報告 Final group project 
20% 
 
 
課程進度
週次
日期
單元主題
第1週
09/07  課程導論:什麼是健康大數據
Introduction: What is big data in health? (馮嬿臻老師) 
第2週
09/14  健康大數據的資料收集與來源:癌症登記資料介紹
Data Collection and Sources of Big-data Research: Introduction of population-based cancer registry database (江濬如老師) 
第3週
09/21  健康大數據的資料收集與來源:健保資料庫與死亡登記的介紹
Data Collection and Sources of Big-data Research: Introduction to National Health Insurance Research Database and death registries(江濬如老師) 
第4週
09/28  健康大數據的資料收集與來源:癌登、健保與死亡等資料運用
Data Collection and Sources of Big-data Research: Applications of cancer registries, NHIRD, and death registries (江濬如老師) 
第5週
10/05  健康大數據的資料分析:迴歸(馮嬿臻老師)
Analysis of big data: Regression 
第6週
10/12  健康大數據的資料分析:迴歸(馮嬿臻老師)
Analysis of big data: Regression 
第7週
10/19  健康大數據的資料分析:資料整理與視覺化(王彥雯老師)
Analysis of big data: Organizing and visualizing data 
第8週
10/26  健康大數據的資料分析:分群(王彥雯老師)
Analysis of big data: Clustering analysis 
第9週
11/02  健康大數據的資料分析:分群、分類(王彥雯老師)
Analysis of big data: Clustering and classification analysis 
第10週
11/09  健康大數據的資料分析:分類(王彥雯老師)
Analysis of big data: Classification 
第11週
11/16  健康大數據的資料分析:基因資料分析簡介(馮嬿臻老師)
Analysis of big data: Introduction to genetics data analysis 
第12週
11/23  健康大數據資料來源與分析:以英國醫院資料庫為例
Sources and analyses of big data in health: Studies with hospital-based datasets in UK (張慶國老師) 
第13週
11/30  健康大數據資料收集與來源:臺灣人體生物資料庫介紹
Data Collection and Sources of Big-data Research: Introduction of Taiwan Biobank(張慶國老師) 
第14週
12/07  健康大數據資料收集與來源:應用自然語言處理分析電子病歷
Data Collection and Sources of Big-data Research: Applying Artificial Intelligence and Natural Language Processing(張慶國老師) 
第15週
12/14  期末報告(馮嬿臻老師、王彥雯老師)
Final project: group presentation 
第16週
12/21  期末報告(馮嬿臻老師、王彥雯老師)
Final project: group presentation